DNN From Scratch: The nuts and bolts

Python

Deep Learning

Achieving 83% accuracy on the Titanic Kaggle competition dataset with a DNN built from scratch.

Author

Jake Gehri

Published

November 1, 2022

import torch
import pandas as pd
import numpy as np
import torch.nn.functional as F
from fastai import *
from fastbook import *

data = pd.read_csv('train.csv')

data.head()

	PassengerId	Survived	Pclass	Name	Sex	Age	SibSp	Ticket	Fare	Cabin	Embarked
0	1	0	3	Braund, Mr. Owen Harris	male	22.0	1	A/5 21171	7.2500	NaN	S
1	2	1	1	Cumings, Mrs. John Bradley (Florence Briggs Th...	female	38.0	1	PC 17599	71.2833	C85	C
2	3	1	3	Heikkinen, Miss. Laina	female	26.0	0	STON/O2. 3101282	7.9250	NaN	S
3	4	1	1	Futrelle, Mrs. Jacques Heath (Lily May Peel)	female	35.0	1	113803	53.1000	C123	S
4	5	0	3	Allen, Mr. William Henry	male	35.0	0	373450	8.0500	NaN	S

data.isna().sum()

PassengerId      0
Survived         0
Pclass           0
Name             0
Sex              0
Age            177
SibSp            0
Parch            0
Ticket           0
Fare             0
Cabin          687
Embarked         2
dtype: int64

modes = data.mode().iloc[0]
modes

PassengerId                      1
Survived                       0.0
Pclass                         3.0
Name           Abbing, Mr. Anthony
Sex                           male
Age                           24.0
SibSp                          0.0
Parch                          0.0
Ticket                        1601
Fare                          8.05
Cabin                      B96 B98
Embarked                         S
Name: 0, dtype: object

data.fillna(modes, inplace=True)

data.isna().sum()

PassengerId    0
Survived       0
Pclass         0
Name           0
Sex            0
Age            0
SibSp          0
Parch          0
Ticket         0
Fare           0
Cabin          0
Embarked       0
dtype: int64

data.describe(include=(np.number))

	PassengerId	Survived	Pclass	Age	SibSp	Parch	Fare
count	891.000000	891.000000	891.000000	891.000000	891.000000	891.000000	891.000000
mean	446.000000	0.383838	2.308642	28.566970	0.523008	0.381594	32.204208
std	257.353842	0.486592	0.836071	13.199572	1.102743	0.806057	49.693429
min	1.000000	0.000000	1.000000	0.420000	0.000000	0.000000	0.000000
25%	223.500000	0.000000	2.000000	22.000000	0.000000	0.000000	7.910400
50%	446.000000	0.000000	3.000000	24.000000	0.000000	0.000000	14.454200
75%	668.500000	1.000000	3.000000	35.000000	1.000000	0.000000	31.000000
max	891.000000	1.000000	3.000000	80.000000	8.000000	6.000000	512.329200

data.describe(include=object)

	Name	Sex	Ticket	Cabin	Embarked
count	891	891	891	891	891
unique	891	2	681	147	3
top	Braund, Mr. Owen Harris	male	347082	B96 B98	S
freq	1	577	7	691	646

data['Fare'].hist()

<AxesSubplot:>

data['LogFare'] = np.log(data['Fare'] + 1)

data.head()

	PassengerId	Survived	Pclass	Name	Sex	Age	SibSp	Ticket	Fare	Cabin	Embarked	LogFare
0	1	0	3	Braund, Mr. Owen Harris	male	22.0	1	A/5 21171	7.2500	B96 B98	S	2.110213
1	2	1	1	Cumings, Mrs. John Bradley (Florence Briggs Th...	female	38.0	1	PC 17599	71.2833	C85	C	4.280593
2	3	1	3	Heikkinen, Miss. Laina	female	26.0	0	STON/O2. 3101282	7.9250	B96 B98	S	2.188856
3	4	1	1	Futrelle, Mrs. Jacques Heath (Lily May Peel)	female	35.0	1	113803	53.1000	C123	S	3.990834
4	5	0	3	Allen, Mr. William Henry	male	35.0	0	373450	8.0500	B96 B98	S	2.202765

data = pd.get_dummies(data, columns = ['Pclass', 'Sex', 'Embarked'])

data.head()

	PassengerId	Survived	Name	Age	SibSp	Ticket	Fare	Cabin	LogFare	Pclass_1	Pclass_3	Sex_female	Sex_male	Embarked_C	Embarked_S
0	1	0	Braund, Mr. Owen Harris	22.0	1	A/5 21171	7.2500	B96 B98	2.110213	0	1	0	1	0	1
1	2	1	Cumings, Mrs. John Bradley (Florence Briggs Th...	38.0	1	PC 17599	71.2833	C85	4.280593	1	0	1	0	1	0
2	3	1	Heikkinen, Miss. Laina	26.0	0	STON/O2. 3101282	7.9250	B96 B98	2.188856	0	1	1	0	0	1
3	4	1	Futrelle, Mrs. Jacques Heath (Lily May Peel)	35.0	1	113803	53.1000	C123	3.990834	1	0	1	0	0	1
4	5	0	Allen, Mr. William Henry	35.0	0	373450	8.0500	B96 B98	2.202765	0	1	0	1	0	1

dep_var = ['Survived']

indep_vars = ['Age', 'SibSp', 'Parch', 'LogFare', 'Pclass_1', 'Pclass_2', 'Pclass_3', 'Sex_female', 'Sex_male', 'Embarked_C', 'Embarked_Q', 'Embarked_S']

len(indep_vars)

y = torch.tensor(data[dep_var].values, dtype=torch.float)

X = torch.tensor(data[indep_vars].values, dtype=torch.float)

vals, indicies = X.max(dim=0)

X = X / vals

trn_split, val_split = RandomSplitter(seed=42)(X)

len(trn_split), len(val_split)

(713, 178)

X_train, y_train = X[trn_split], y[trn_split]
X_val, y_val = X[val_split], y[val_split]

nips = X_train.shape[1]

torch.manual_seed(42)

def get_coeffs(nips = nips, l1_size = 20, n_classes = 1):
    layer1 = (torch.rand(nips, l1_size)-0.5) / nips
    layer2 = (torch.rand(l1_size, n_classes)-0.5)
    const = torch.rand(1)[0]
    return layer1.requires_grad_(), layer2.requires_grad_(), const.requires_grad_()

def forward_pass(coeffs, X_train):
    l1, l2, const = coeffs
    acts = F.relu(X_train@l1)
    acts = acts@l2 + const
    return torch.sigmoid(acts)

def calc_loss(acts, y_train): return torch.abs(acts - y_train).mean()

def backprop(coeffs, lr):
    for layer in coeffs:
        layer.sub_(layer.grad * lr)
        layer.grad.zero_()

def one_epoch(coeffs, lr):
    acts = forward_pass(coeffs, X_train)
    loss = calc_loss(acts, y_train)
    loss.backward()
    with torch.no_grad(): backprop(coeffs, lr)
    print(f"{loss:.3f}", end = "; ")

def acc(coeffs): return (y_val.bool()==(forward_pass(coeffs, X_val)>0.5)).float().mean()

def train_model(epochs=50, lr=2):
    torch.manual_seed(42)
    coeffs = get_coeffs()
    for i in range(epochs): one_epoch(coeffs, lr)
    return coeffs, acc(coeffs)

_, acc = train_model()

0.548; 0.529; 0.503; 0.466; 0.408; 0.357; 0.330; 0.313; 0.298; 0.286; 0.277; 0.269; 0.261; 0.255; 0.249; 0.244; 0.239; 0.235; 0.231; 0.229; 0.226; 0.224; 0.222; 0.220; 0.219; 0.217; 0.216; 0.215; 0.214; 0.213; 0.212; 0.211; 0.211; 0.210; 0.209; 0.209; 0.208; 0.207; 0.207; 0.206; 0.206; 0.205; 0.205; 0.204; 0.204; 0.204; 0.203; 0.203; 0.203; 0.202;

acc

tensor(0.8258)